其他位置度量总结 - 四分位数、百分位数与插值法
四分位数将数据分为四等份的三个分位点:
关键关系:四分位数反映数据的分布特征,\(Q_1\)、\(Q_2\)、\(Q_3\)将数据分为四个相等的部分。
若结果为整数,取该位置与下一个位置数据的平均值;若为非整数,向上取整取对应位置数据。
20个数据:\(Q_1\)位置\(\frac{20}{4}=5\),取第5、6个数据的平均值
\(Q_3\)位置\(\frac{3×20}{4}=15\),取第15、16个数据的平均值
百分位数将数据分为100等份的99个分位点,第\(p\)百分位数(\(P_p\))表示约\(p\%\)的数据小于它,\((100-p)\%\)的数据大于它。
当数据以分组频率表呈现时,通过假设组内数据均匀分布,估计中位数、四分位数、百分位数。
上网时间分组:30-31(2), 32-33(25), 34-36(30), 37-39(13)
累计频率:2, 27, 57, 70
\(Q_3\)位置\(\frac{3×70}{4}=52.5\),落在"34-36"组
插值计算:\(Q_3 = 33.5 + \frac{52.5-27}{30}×3 = 36.05\)
掌握其他位置度量是描述性统计的重要工具,它为后续的箱线图、异常值检测和统计推断提供了基础。
很多学生在使用插值法时会忘记计算累计频率,或者组边界确定错误,导致最终结果不准确。
长远价值:掌握其他位置度量是统计学的重要基础,它为后续的箱线图、异常值检测、统计推断和假设检验提供了基本工具。通过练习可以培养数据分析和统计思维,为后续学习统计学做好准备。